python2.x中urllib2库在python 3.x 中为urllib.request
urlopen()函数即创建一个类文件对象为指定的 url 来读取。1
2
3
4
5
6
7 help(urllib.urlopen)
Help on function urlopen in module urllib:
urlopen(url, data=None, proxies=None)
Create a file-like object for the specified URL to read from.
详细点就是,创建一个表示远程url的类文件对象,然后像本地文件一样操作这个类文件对象来获取远程数据。参数url表示远程数据的路径,一般是网址;参数data表示以post方式提交到url的数据,参数proxies用于设置代理
urlopen返回 一个类文件对象,他提供了如下方法:
参数 url 表示远程数据的路径,一般是 http 或者 ftp 路径。
参数 data 表示以 get 或者 post 方式提交到 url 的数据。
参数 proxies 表示用于代理的设置。
urlopen 返回一个类文件对象,它提供了如下方法:
read() , readline() , readlines(),fileno()和close(): 这些方法的使用与文件对象完全一样。
info():返回一个httplib.HTTPMessage 对象,表示远程服务器返回的头信息。
getcode():返回Http状态码,如果是http请求,200表示请求成功完成;404表示网址未找到。
geturl():返回请求的url地址。
google = urllib.urlopen(‘http://www.google.com')
print ‘http header:/n’, google.info()
print ‘http status:’, google.getcode()
print ‘url:’, google.geturl()
for line in google: # 就像在操作本地文件
print line,
google.close()